前言
早上8点左右的时候看到了微信群里有一条分享,点开进去后是一个视频,是网易新闻的一个关于圣诞节的一个推广视频,刚好就坐在电脑旁边,便用 Charles 抓包看了下。
因为以前对视频加载这块接触的不多,便想了解下获取视频的请求和普通的请求有什么不通,如何播放就不谈了,主要从HTTP协议的角度研究学习下。
刚打开网页的时候只有前3个请求,此时视频是暂停的,通过视频上方中的播放按钮开始了播放,这时候开始发出了第4个请求。
1 | HTTP-Trace-Version: 1.0 // Charles的http trace版本 |
这是第一个请求的一些详细信息,其余3个请求我就不贴了,比较占篇幅,值得注意的是,这4个请求中请求头的range每一个都不同,依次如下:
- bytes=0-1
- bytes=0-4300046
- bytes=4276224-4300046
- bytes=8640-4276223
Range的诞生
Range,是在 HTTP/1.1里新增的一个请求头字段域。我们使用的迅雷等支持多线程下载以及断点下载的核心也是基于此重要特性。
HTTP/1.1规范的 Range 的约定
如果Server支持 Range,首先就要告诉客户端,服务器会在响应头中添加Accept-Ranges: bytes
来表示支持 Range 的请求,之后客户端才可能发起带 Range 的请求。不支持的话,用Accept-Ranges: none
告知客户端,对不起,我不支持。
Server通过请求头中的Range: bytes=0-xxx
来判断是否是做 Range 请求,如果这个值存在而且有效,则只发回请求的那部分文件内容,响应的状态码变成206,表示Partial Content,并设置Content-Range。如果无效,则返回416状态码,表明Request Range Not Satisfiable。如果请求头中不带 Range,那么 Server则正常响应,也不会设置 Content-Range 等。
Value | Description |
---|---|
206 | Partial Content |
416 | Range Not Satisfiable |
Range的格式为:
Range:(unit=first byte pos)-[last byte pos]
,即Range: 单位(如bytes)= 开始字节位置-结束字节位置
。
我们再来看个例子。假设我们要开启多线程下载,需要把一个大文件分割成多个部分进行下载,比如4个部分,然后创建4个线程,每个线程负责下载一个部分,如果文件大小为 5000 个 byte(随意的数字),那么我们可以划分为
- Range: bytes=0-1199 头1200个字节
- Range: bytes=1200-2399 第二个1200字节
- Range: bytes=2400-3599 第三个1200字节
- Range: bytes=3600-5000 最后的1400字节
服务器给出响应:
// 第1个响应
- Content-Length:1200
- Content-Range:bytes 0-1199/5000
// 第2个响应
- Content-Length:1200
- Content-Range:bytes 1200-2399/5000
// 第3个响应
- Content-Length:1200
- Content-Range:bytes 2400-3599/5000
// 第4个响应
- Content-Length:1400
- Content-Range:bytes 3600-5000/5000
如果每个请求都成功了,服务器返回的response头中有一个 Content-Range 的字段域,Content-Range 用于响应头,告诉了客户端发送了多少数据,它描述了响应覆盖的范围和整个实体长度。一般格式:
Content-Range: bytes (unit first byte pos) - [last byte pos]/[entity length]
即Content-Range:字节 开始字节位置-结束字节位置/文件大小
。
小结
HTTP协议博大精深,设计有很多巧妙的地方,Range也许就是一处吧。